Domaći III

Linearna i logistička regresija

Student: Čabarkapa Slađana (10 / 2025)

Baza podataka

Za potrebe prvog domaćeg koristićemo dio baze podataka koja sadrži informacije o nivou ekonomskog i političkog razvoja. Datoteka dodijeljena svakom studentu sadrži između 100 i 150 redova (država) i 10 kolona (varijabli). Detaljan opis varijabli nalazi se u Tabeli 1:

Tabela 1. Pregled varijabli u bazi podataka

Varijabla Opis Skala
naziv Ime države Nominalna
razvoj Indeks ljudskog razvoja (HDI) Intervalna
rezim Kojeg je tipa politički režim Nominalna
gini Indeks ekonomske nejednakosti (GINI) Intervalna
frak Nivo etničke frakcionalizacije Ordinalna (kategorička)
vijek Prosječno trajanje životnog vijeka Intervalna
urban Udio urbanog stanovništva u populaciji Intervalna
nejed Nivo rodne nejednakosti Intervalna
oecd Da li je država članica OECD Ordinalna (kategorička)
nivodem Nivo demokratije Intervalna

Zadatak

  1. Učitati bazu podataka čabarkapa-slađana-III.xlsx u R.

  2. Rekodirati nedostajuće vrijednosti na svakoj varijabli.

  3. Izračunati Pirsonovu linearnu korelaciju između nivoa demokratije i rodne nejednakosti. Interpretirati rezultat.

  4. Grafički prikazati korelaciju između dvije varijable.

  5. Kreirati linearni model (OLS) koristeći nivo demokratije kao zavisnu varijablu, a rodnu nejednakost, procent urbane populacije i indeks ekonomske nejednakosti (GINI)kao nezavisne varijable.

    1. Interpretirati rezultate.

    2. Grafički prikazati odnos između nivoa demokratije i procenta (udjela) urbane populacije.

  6. Kreirati novi linearni model dodavanjem još dvije nezavisne varijable: nivo etničke frakcionalizacije i članstvo države u OECD.

    1. Obrazložiti način na koji je varijabla nivo etničke frakcionalizacije uključena u analizu?

    2. Interpretirati rezultate novog modela.

    3. Uporediti kvalitet i rezultate prvog i drugog modela.

  7. Kreirati logistički model na osnovu kojeg možemo izračunati uticaj procenta (udjela) urbane populacije, indeksa ekonomke nejednakosti (GINI) i rodne nejednakosti na nivo etničke frakcionalizacije.

    1. Interpretirati rezultate.

    2. Koji procent slučajeva je model tačno predvidio?

  8. Kreirati logistički model na osnovu kojeg možemo izračunati vjerovatnoću članstva države u OECD-u koristeći iste nezavisne varijable kao u slučaju prvog logističkog modela.

    1. Interpretiraj rezultate.

    2. Koji procent slučajeva je model tačno predvidio?

  9. Koristeći prvi logistički model izračunaj kolika je vjerovatnoća da će država etnički heterogena , sa indeksom ekonomske nejednakosti 55 , sa nivoom rodne nejednakosti 85 biti članica OECD-a. Interpretirati rezultat.

Instrukcije

  1. Rok za predaju domaćeg zadatka je 1.6.2026. u 13.00. Radove poslati na nbatricevic.fpn@gmail.com.

  2. Domaći zadatak dostaviti u Word formatu. Naziv fajla bi trebalo da prati format: Domaci_III_Čabarkapa_Slađana

  3. Fajl sa domaćim zadatkom trebalo bi da sadrži: kod, rezultat (output iz konzole) i interpretaciju.

Napomena: nepotpuni domaći zadaci neće biti pregledani.